Day 20 第三站 Modeling - 如何選擇合適的指標來驗證與訓練模型? - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2023 iThome 鐵人賽

DAY 20

AI & Data

夥伴們!一起航向AWS Certified Machine Learning Specialty的偉大航道吧!系列第 20 篇

Day 20 第三站 Modeling - 如何選擇合適的指標來驗證與訓練模型?

15th鐵人賽

chrisspeed

2023-10-05 21:43:37

520 瀏覽

分享至

訓練好AI模型之後，我們可以從不同的觀點來去驗證AI模型。以下針對分類模型的幾種驗證方法，分別跟大家介紹。

1. Confusion Matrix

以二元分類來說明Confusion Matrix。模型分別預測0與1，這時候，就會有四種排列組合：

答案是1且預測也是1 --> TP(True Positive)
答案是1但預測是0 --> FN (False Negative)
答案是0且預測也是0 --> TN (True Negative)
答案是0但預測是1 --> FP(False Positive)

如下圖，Confusion Matrix就是去呈現實際答案跟模型預測的相對關係。透過這種方式，我們可以直觀觀察模型今天預測錯誤，主要問題發生在哪，是False Positive呢？或是False Negative的問題呢？如果是多元分類，還可以進一步觀察是哪一些類別導致模型特別容易預測錯誤，可以依此對症下藥，去調整資料前處理或者模型訓練權重的調整。

2. Precision

Precision的公式是TP/(TP+FP)。這個指標特別關注在FP的問題上，當FP越大，Precision越差。實際案例來看的話，例如冤獄，抓錯人會讓這個人白白坐牢很久。

3. Recall

Recall的公式是TP/(TP+FN)。這個指標特別關注FN的問題，如果FN越大，則Recall數值越小。實際應用案例的話，例如詐騙偵測、重大疾病檢查、防毒軟體檢測。換言之，寧可錯殺，也不放過。

4. F1 Score

F1 Score同時考量到Precision與Recall，其公式是= 2*(Precision*Recall)/(Precision + Recall)

5. ROC Curve 與 AUC

ROC(Receiver Operating Characteristic Curve)的橫軸是False Positive Rate，縱軸是True Positive Rate。相當而然，False Positive Rate越小，並且True Positive Rate越大，模型的表現就越好，因此我們期待看到曲線落在左上方的角落。圖中的對角線表示隨機去猜測的結果，因此，模型表現只要高於這條對角線，就表示已經表現得比隨機猜選來的好。

而AUC(Area Under Curve)，則是表示ROC曲線下的面積。因此，當這個面積越大，就表示模型表現越好。面積如果是0.5，則是隨機猜測的表現。因此，只要AUC大於0.5，就表示表現優於隨機猜測。